- 快捷搜索
- 全站搜索
随着多媒体设备与技术的迅速发展,个人手机、监控摄像头、医学影像、卫星图像等在许多领域大量产生,越来越多的图像和影像被更容易、快速、廉价地获取和存储。如何从这些图像中分析并发掘出有价值的信息,并形成有用的知识成为了图像挖掘技术的研究重点。
图像挖掘(Image Mining)技术是指从图像数据库中抽取潜在的、有用的知识并关系图像数据的过程,是计算机视觉、图像处理、图像检索、数据挖掘、模式识别和人工智能等多学科交叉的研究领域。目前该技术在一些垂直领域的技术应用比较成熟,如人脸检测、平面物体如海报图书的图像检索、印刷体书籍文字识别等,其他方向都还依赖于持续研发和建设。

一、图像挖掘技术浅谈
图像挖掘过程通常如下:首先通过传感器获得数据,然后进行预处理、特征提取、特征选择,最后做出推理、预测或识别。其中第二部分概括起来就是特征的表达,良好的特征表达能对最终算法的准确性起到关键的作用。以前,样本特征的抽取往往依靠人工经验,模型主要是负责分类和预测。在模型运用正确的前提下,特征的好坏就成了系统性能的瓶颈。
SIFT(Scale—invariant feature transform)算法。该算法是一种检测局部特征的算法,由David Lowe在1999年提出,并于2004年完善总结。作为特征提取的经典算法,许多科学家都对SIFT算法进行了研究改进,产生了一系列变种。SIFT算法主要特性在于尺度的不变性,即使改变图像旋转角度、缩放、明亮度或是拍摄视角,该算法仍然能取得较好的检测效果。
HoG(Histogram of Oriented Gradient)算法。该算法由Navneet Dalal和Bill Triggs于2005年提出,主要用于静态图像和视频的行人检测,以及静态图像中的车辆和常见动物的检测,该方法计算局部图梯度方向信息的统计值。与SIFT相比,HoG没有旋转和尺度不变性,且计算量较小。
二、深度学习焕发挖掘新生命
传统图像技术,一直以来依赖于专家特征和各种浅层模型的学习,现已进入瓶颈期,难以实现实用化。随着认知神经科学、生物学等学科的发展,科学家对人脑视觉系统有了深入的认识,这方面的研究也给人工智能的发展带来推波助澜的作用。
科学家研究发现,人类视觉系统的信息处理是分层的。视网膜获得光信号后,人脑从低级的V1区提取边缘特征,再到V2区的形状,最后到高层对整体目标物体的识别。高层特征是低层特征的组合,从低层到高层特征的表示变得抽象,更偏向含义或意图。
在此基础上,模拟人脑工作模式的深层神经网络(DNN,Deep Neural Networks)或深度学习(Deep Learning)被提出。一个图像可以由最基本的“边缘”(Edge)构成,边缘的组合形成“对象部分”(Object Parts),往上组合形成“对象模型”(Object Model)——这一点类似于文本的结构。最基本的笔画类似图片中的像素,往上形成文字、词语、段落、主题,从而被人们理解和学习。
深度学习的实质是模拟人脑神经的层次结构,构建多层机器学习模型和使用海量的训练数据,由上向下逐级地进行信息特征抽取,最终让机器“自主”地学习适合模式分类的较理想的特征,从而最终提升分类和预测的准确性。
图像技术与深度学习结合后焕发了新的生命。2012年,深度学习在图像识别领域取得惊人的效果,在ImageNet评测上将错误率从26%一举降低到15%,自此图像技术迸发了巨大的能量。深度学习对视觉技术重要性的一个佐证,就是脑神经系统的确具有丰富的层次结构,如Hubel—Wiesel模型,由于揭示了视觉神经的机理而曾获得诺贝尔医学与生理学奖。
2012年6月,《纽约时报》披露了Google Brain项目,这个项目是由现百度研究院院长、著名的斯坦福大学机器学习教授Andrew Ng和大规模计算专家Jeff Dean共同主导,用16000个CPU Core的并行计算平台训练深层神经网络模型,可以教会计算机自主识别出“猫”。百度是国内图像视觉技术积累最为深厚的企业机构,其图像技术成果和应用也得到业界的广泛认可。目前百度拥有世界上规模最大的人工神经网络,并在图像识别、人脸和文字识别、图像搜索等领域都有一流的产品应用。
随着大数据时代的来临,图像和视频数据呈爆发性增长,若同时处理亿级别、几十亿级别的图像视频数据是一个巨大的难题,因此深度学习技术一直面临着性能的挑战。另一方面,图像识别技术尤其是不限定类别的通用图像识别,仍然是一个离实用和人类期待有差距的技术,但这个技术极为重要,它是计算机认识和理解世界的最重要窗口,因此必须持之以恒地加大投入、攻克技术难题。
三、深度学习技术在图像中的应用
相似图片搜索系统:可以实现图像的识别并从图片库检索到相同和相似图片。
拍照搜索:该技术多用于商业营销,如百度识图对于无法精确描述的服装、箱包,与运营平台合作可以实现拍照搜索和购买,有巨大的商业潜力。
人脸识别:FaceBook利用该功能加强客户粘性。用户可以利用人脸识别功能,帮助他们方便地在一张照片中识别一位朋友并分享内容。当用户上传新照片后,可使用一种与很多图片编辑工具相似的软件,将新照片与用户已经加了标签的照片进行匹配,把相似的照片归为一组,然后尽可能地向用户推荐照片中朋友的名字。这项功能提高了用户给照片加标签的效率,特别是用户一次上传很多张相同的朋友的照片的时候。
深度学习受到了从学术界到工业界广泛的重视,并在图像分类、识别等方面取得了惊人的进展,从而推动了人工智能的大踏步前进。金融行业可以将图像发掘技术应用于识别方面,如签名、账单OCR电子化识别、视频影像中的人像识别等。同时,作为一项图像发掘的基础技术,深度学习还能在其他领域发挥重要的作用。金融行业可以利用人工智能技术从数据中挖掘价值,做出准确的推理和预测,实现精准营销和个性化服务,驱动金融产品创新。
(文章来源:《金融电子化》杂志)
商业银行发展互联网金融,其实对既有的技术体系规划和设计提出了新的要求。
商业银行发展互联网金融,其实对既有的技术体系规划和设计提出了新的要求。